AI资讯新闻榜单内容搜索-DeepSeek

新版DeepSeek R1你得这样用，太爽啦~

哈喽，大家好，我是袋鼠帝昨天下午下班后，DeepSeek R1更新了然而他们就只是悄悄在微信群里面发布了这个消息。

来自主题: AI资讯

9344 点击 2025-05-29 11:50

大风起兮云飞扬：Agent, o3幻觉, 刷榜, 大厂布局深意… | 南乔的月度观察

近半年来，OpenAI 形象开始变得灰暗：团队骨干相继离职引发猜疑、组织转型遭受口诛笔伐、GPT-4.5/Sora 等模型表现不及预期，还有被 DeepSeek R1 打破的叙事神话……

来自主题: AI资讯

11741 点击 2025-05-29 10:56

Meta「轻量级」KernelLLM颠覆GPU内核生成，8B参数碾压GPT-4o

Meta推出KernelLLM，这个基于Llama 3.1微调的8B模型，竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示，它的单次推理性能超越GPT-4o和DeepSeek V3，多次生成时得分飙升。

来自主题: AI技术研报

8084 点击 2025-05-27 18:00

帮大模型提速80%，华为拿出昇腾推理杀手锏FlashComm，三招搞定通算瓶颈

在今年 2 月的 DeepSeek 开源周中，大模型推理过程中并行策略和通信效率的深度优化成为重点之一。在今年 2 月的 DeepSeek 开源周中，大模型推理过程中并行策略和通信效率的深度优化成为重点之一。

来自主题: AI技术研报

8093 点击 2025-05-23 10:18

DeepSeek们越来越聪明，却也越来越不听话了。

在今年，DeepSeek R1火了之后。

来自主题: AI资讯

6936 点击 2025-05-20 10:44

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达官宣新办公室落户中国台湾省台北市，但居然是从太空飞下来的吗？

来自主题: AI资讯

8382 点击 2025-05-19 17:31

中国 AI 大厂，被 Deepseek 掀了牌桌之后

当技术范式重构，强者也不得不重新起跑。

来自主题: AI资讯

7961 点击 2025-05-19 14:58

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

10030 点击 2025-05-15 17:12

欧洲黑马Mistral Medium 3来了！跑分对标最强Claude，实测大翻车

法国初创Mistral，刚刚推出定价碾压DeepSeek V3的模型，而模型性能，却超过Claude Sonnet 3.7的90%。不过在网友们的实测中，它却翻车了？有人建议：不必下载浪费流量和硬盘空间。

来自主题: AI资讯

10675 点击 2025-05-08 10:15

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

10601 点击 2025-05-06 15:07